草庐IT

实际有效的Python html解析

全部标签

ruby - 在 Ruby 中声明 "private"/"protected"时实际发生了什么?

在Ruby类定义中声明private/protected时实际发生了什么?他们不是keywords,这意味着它们必须是方法调用,但我找不到它们的定义位置。它们似乎没有记录在案。声明private/protected方法(如下所示)的两种不同实现方式是否不同?(第二种方式显然是方法调用,但在第一种方式中并不那么明显。)classFooprivatedefi_am_private;enddefso_am_i;endendclassFoodefi_am_private;enddefso_am_i;endprivate:i_am_private,:so_am_iend

ruby - 如何在 Ruby 中有效地解析大文本文件

我正在编写一个导入脚本来处理一个可能有数十万行的文件(日志文件)。使用一个非常简单的方法(如下)占用了足够的时间和内存,我觉得它随时都会耗尽我的MBP,所以我终止了这个过程。#...File.open(file,'r')do|f|f.each_linedo|line|#dostuffheretolineendend这个文件特别有642,868行:$wc-lnginx.log/code/src/myimport642868../nginx.log有谁知道处理此文件中每一行的更有效(内存/cpu)方法吗?更新上面f.each_line中的代码只是将正则表达式与该行进行匹配。如果匹配失败,我

ruby-on-rails - ArgumentError : Unknown key: :conditions. 有效键是 : :class_name, :class, :foreign_key

在尝试rake:dbmigrate之后,我在终端中得到了这个错误rakeaborted!ArgumentError:Unknownkey::conditions.Validkeysare::class_name,:class,:foreign_key,:validate,:autosave,:table_name,:before_add,:after_add,:before_remove,:after_remove,:extend,:primary_key,:dependent,:as,:through,:source,:source_type,:inverse_of,:counter

ruby - 哪个是 ANTLR 在 ruby​​ 中创建解析器的最佳对应物?

我使用antlr和javacc/freecc有一段时间了。现在我需要使用antlr语法编写一堆解析器,但此类解析器需要用ruby​​lang编写。我用谷歌搜索但没有找到。是否有任何采用antlr语法并创建解析器的ruby​​解析器生成器?如果有很多,您认为哪个是最好的?TIA保罗 最佳答案 您可以使用JRuby轻松逃脱并将您的ANTLR解析器保存在java中。如果PEGs足以胜任你的工作,treetop和更新的citrus是ruby​​ists使用的常用工具。我在研究项目时挖掘的其他解析器是:peggy,Kanocc,Racc.对于

ruby - Vpim::Vcard - 解析 vcard 2.1

我的代码必须解析Vcard2.1格式。我正在使用vpim(没有其他库)当我运行Vpim::Vcard.decode(data)时出现错误:undefinedmethod`each'for#堆栈跟踪:NoMethodError(undefinedmethod`each'for#):vpim(0.695)lib/vpim/rfc2425.rb:82:in`unfold'vpim(0.695)lib/vpim/rfc2425.rb:308:in`decode'vpim(0.695)lib/vpim/vcard.rb:692:in`decode'app/models/event.rb:71:i

ruby - 在 Ruby 中使用 Nokogiri 解析 HTML

使用此HTML代码:....................如何使用Nokogiri选择类为1的第二个或第三个div? 最佳答案 您可以使用Ruby将大型结果集缩减为特定项目:page.css('div.one')[1,2]#Twoitemsstartingatindex1(2nditem)page.css('div.one')[1..2]#Itemswithindicesbetween1and2,inclusive因为Ruby索引从零开始,所以你必须注意你想要的项目。或者,您可以使用CSS选择器来查找nthitem:#Second

ruby - 在 Ruby 中解析 URL 以获得没有 "www"的子域或主域?

如果我有一个URL:http://www.example.com/page我想将其解释为:example.com但是,如果我有:http://blog.example.com/page我想回去:blog.example.com这很难吗? 最佳答案 使用Ruby的URI模块:require'uri'URI.parse('http://www.example.com/page').host=>"www.example.com"URI.parse('http://blog.example.com/page').host=>"blog.ex

ruby - 使用 ruby​​ 解析 PDF 文档

我在一个文件夹中有多个具有特定结构的PDF文档:现在我希望能够解析PDF中的信息。请注意,段落的长度各不相同。显然,我并不是要你为我解决问题,但我确实需要一些关于如何实现这一目标的指导。我以前使用过nokogiri,从技术上讲,我需要类似的东西,但用于PDF。因此我的示例的伪结果如下所示:-ItemA-Title:ItemA-File:123456789.pdf-Image:ImageA.png(theimagewasstoredondisk)-Subtitle1:Contentforsubtitle1-Subtitle2:Contentforsubtitle2-Subtitle3:C

ruby - 如何在 Ruby 中列出有效的 Iconv 编码?

如何在windows7下获取Ruby1.9.1中的有效Iconv编码列表? 最佳答案 也许这会有所帮助:putsEncoding.listputsEncoding.aliases它返回一个加载的编码列表,以及一个编码别名的散列:ASCII-8BITUTF-8US-ASCIIBig5CP949Emacs-MuleEUC-JPEUC-KREUC-TW...{"BINARY"=>"ASCII-8BIT","CP437"=>"IBM437","CP737"=>"IBM737","CP775"=>"IBM775","IBM850"=>"CP8

ruby-on-rails - 如何在 RoR 中上传文本文件并将内容解析到数据库中

到目前为止,我已经成功上传了一个文件:#Innew.html.erb并访问Controller中的文件#Incontroller#create@text=params[:upload][:file]但是,这给我的只是文件名,而不是文件的内容。如何访问其内容?我知道这是一个跳跃,但是一旦我可以访问文件的内容,是否可以上传文件夹并遍历文件? 最佳答案 完整示例以上传包含联系人的导入文件为例。您无需存储此导入文件,只需对其进行处理并丢弃即可。路线routes.rbresources:contactsdocollectiondoget'im